home *** CD-ROM | disk | FTP | other *** search
/ SGI Freeware 2002 November / SGI Freeware 2002 November - Disc 2.iso / dist / fw_glimpse.idb / usr / freeware / src / glimpse-3.0 / defs.h.z / defs.h
C/C++ Source or Header  |  1997-09-09  |  1KB  |  20 lines

  1. #ifndef _GIMPSE_DEFS_H_
  2. #define _GIMPSE_DEFS_H_
  3. #define MAX_ARGS    80    /* English alphabets + numbers + pattern + progname + arguments + extras */
  4. #define MAXFILEOPT    1024    /* includes length of args too: #args is <= MAX_ARGS */
  5. #define BLOCKSIZE    8192    /* For compression: what is the optimal unit of disk i/o = n * pagesize */
  6.  
  7. /*
  8.  * These are some parameters that allow us to switch between offset computation
  9.  * and just index computation when the index is built at a byte-level: since
  10.  * offset computation is a waste if we can't narrow down search enough (since
  11.  * we must look all over and the lists become too long => bottleneck). This may
  12.  * not be needed if we used trees to store intervals --- we'll do it later :-).
  13.  */
  14.  
  15. #define MAX_DISPARITY    100    /* if least frequent word occurrs in < 1/100 times most frequent word, resort to agrep: don't intersect lists (byte-level) */
  16. #define MIN_OCCURRENCES    20    /* Min no. of occurrences before we check for highly frequent words using MAX_UNION */
  17. #define MAX_UNION    500    /* Don't even perform the Union of offsets if least < 1/500 times most freq word (we are on track of stop list kinda words) */
  18. #define MAX_ABSOLUTE    MaxNum16bPartition    /* Don't even perform the Union of offsets if a word occurs more than 16K times (independent of #of files) */
  19. #endif
  20.